Ja, dann komme ich zu meinem nächsten Vortrag, der da heißt Datenkorruption, wie entsteht
er, welche Folgen kann das haben etc. etc.
Ich beziehe mich in meinem Vortrag auf folgende Quellen.
Einmal das Papier Data Integrity von Herrn Bernd-Panzer Steindl vom CERN, der ausgiebige
Untersuchungen auf allen oder auf einen Großteil der Systeme der CERN-IT durchgeführt hat,
mit doch zum Teil sehr überraschenden Ergebnissen.
Wer dieses Papier haben möchte, es liegt mir vor, das ist ein 8-Seiten-Papier, also es
ist auch relativ schnell durchzulesen, ist auch sehr, sehr schlank gehalten.
Ein Management Summary gibt es auch zu den 8 Seiten, wenn die 8 Seiten auch noch zu lang
sein sollten.
Das Lesen, das lohnt sich definitiv, weil da stehen nämlich doch einige Sachen drin,
die sehr von Interesse sind.
Ich denke mal aber, dass ich die Hälfte der Ergebnisse hier dann auch zeige.
Die zweite Quelle, die ich verwende, ist eine Dissertation, die nennt sich Iron File Systems,
den Namen spreche ich jetzt nicht aus, gemacht an der Universität of Wisconsin Medicine
im Jahr 2006.
Wer das lesen möchte, kann es auch gerne von mir haben, sind allerdings rund 160 Seiten,
das ist also doch ein bisschen aufwendiger.
Geht aber sehr, sehr viel mehr ins Detail und der VJaynen geht da auch sehr, sehr detailliert
auf die Fehlerursachen, die Fehlerquellen und so weiter ein.
Wer Zeitung Muße hat und am Samstagabend nichts anderes im Fernsehen laufen sollte, kann
sich dieses Papier auch mal reinziehen.
Das dritte Analyzing the impact of file formats on data integrity vom Volker Heidegger, Universität
zu Köln aus dem letzten Jahr.
So viel zu den Quellenhinweisen.
Ja, steigen wir mal ins Thema ein.
Mit unseren heutigen Rechnern und HPC Cluster und was auch immer, sind wir in der Lage,
sehr viele schöne Daten auch zu generieren und zu visualisieren.
Nur was passiert, wenn diese Daten eben korrupt werden und eben nicht mehr vom Storage einwandfrei
gelesen werden können, dann passiert nämlich sowas.
Das hier ist das Beispiel Datenverlust eines Bildes, also das reguläre Bild ist noch der
obere Teil und danach sehr bunt.
Das heißt also, was hier passiert ist, man hat versucht von Sektoren einer Festplatte
zu lesen, die keine richtigen Inhalte mehr liefern, aus welchem Grund auch immer.
Auf diese Grunde werde ich nachher darauf eingehen, was das verursachen haben kann.
Aber das kommt am Beiraus.
Sie sehen also, hat nichts mehr mit dem Original zu tun.
Dabei können diese Fehler natürlich sehr variantenreich sein.
Ich habe hier zum Beispiel einmal das Ausgangsbild genommen.
Dieses Ausgangsbild ist genau mit einem Single Byte verändert worden.
An einer bestimmten Stelle dieses Single Byte verändert, führt zu dem Ergebnis oben rechts.
Wie jeder erkennen kann, ist der Unterschied sofort sichtbar.
Bei dem anderen Bild unten rechts sehen Sie erstmal keinen Unterschied, obwohl da auch
nur ein Single Byte verändert worden ist.
Zuerst das Differenzbild zwischen dem Ausgangsbild und dem veränderten Bild, das ist das Bild
nämlich ganz rechts, diese roten Punkte, also diese roten Pixel, die kennzeichnen letztendlich
die Änderungen zwischen den beiden Bildern.
Sehen Sie, dass Unterschiede bestehen.
Es sind sehr feine Unterschiede, aber sie sind da, mit dem Auge so nicht erkennbar.
Also jeder würde sagen, gut, das ist das Bild, ich erkenne es als das Ursprungsbild an.
Presenters
Ralph Hinsche
Zugänglich über
Offener Zugang
Dauer
00:35:48 Min
Aufnahmedatum
2009-11-12
Hochgeladen am
2011-04-11 13:53:27
Sprache
de-DE